Greater

逐元素比较两个输入张量,判断 input1 的元素是否大于 input2 的对应元素。支持广播。

\[\text{output}_i = (\text{input1}_i > \text{input2}_i)\]

输出一个布尔张量,如果比较结果为真,则对应元素为 true,否则为 false

输入:
  • element_num - 输出张量的总元素数量。在广播情况下,等于较大输入张量的元素数量。

  • optimize - 广播优化标志。若为非0,则启用广播模式。

  • in_elements_num0 - 第一个输入张量 input1 的元素数量。用于广播判断。

  • input1 - 第一个输入张量的数据地址。

  • input2 - 第二个输入张量的数据地址。

  • output - (输出) 输出的布尔类型张量的数据地址。

  • core_mask - 核掩码。

输出:
  • output - 写入比较结果的布尔张量。

支持平台:

FT78NE MT7004

备注

  • FT78NE 支持fp32, fp64, int8, int16, int32

  • MT7004 支持fp16, fp32, int16, int32

共享存储版本:

void fp_greater_s(int element_num, int optimize, int in_elements_num0, float *input1, float *input2, bool *output, int core_mask)
void hp_greater_s(int element_num, int optimize, int in_elements_num0, half *input1, half *input2, bool *output, int core_mask)
void dp_greater_s(int element_num, int optimize, int in_elements_num0, double *input1, double *input2, bool *output, int core_mask)
void i32_greater_s(int element_num, int optimize, int in_elements_num0, int32_t *input1, int32_t *input2, bool *output, int core_mask)
void i16_greater_s(int element_num, int optimize, int in_elements_num0, int16_t *input1, int16_t *input2, bool *output, int core_mask)
void i8_greater_s(int element_num, int optimize, int in_elements_num0, int8_t *input1, int8_t *input2, bool *output, int core_mask)

C调用示例:

 1//FT78NE示例
 2#include <stdio.h>
 3#include <greater.h>
 4int main(int argc, char* argv[]) {
 5    float *input1 = (float *)0xA0000000;    // Scalar input, DDR
 6    float *input2 = (float *)0xB0000000;    // Tensor input
 7    bool *output = (bool *)0xC0000000;      // Output
 8
 9    // Broadcasting input1 (scalar) > input2 (tensor)
10    int element_num = 4096; // Size of input2 and output
11    int optimize = 1;       // Enable broadcasting
12    int in_elements_num0 = 1; // Size of input1
13    int core_mask = 0xff;
14
15    fp_greater_s(element_num, optimize, in_elements_num0, input1, input2, output, core_mask);
16    return 0;
17}

私有存储版本:

void fp_greater_p(int element_num, int optimize, int in_elements_num0, float *input1, float *input2, bool *output)
void hp_greater_p(int element_num, int optimize, int in_elements_num0, half *input1, half *input2, bool *output)
void i32_greater_p(int element_num, int optimize, int in_elements_num0, int32_t *input1, int32_t *input2, bool *output)
void i16_greater_p(int element_num, int optimize, int in_elements_num0, int16_t *input1, int16_t *input2, bool *output)
void i8_greater_p(int element_num, int optimize, int in_elements_num0, int8_t *input1, int8_t *input2, bool *output)

C调用示例:

 1//FT78NE示例
 2#include <stdio.h>
 3#include <greater.h>
 4int main(int argc, char* argv[]) {
 5    float *input1 = (float *)0x10000000;    // Tensor input, L2
 6    float *input2 = (float *)0x11000000;    // Scalar input
 7    bool *output = (bool *)0x12000000;      // Output
 8
 9    // Broadcasting input1 (tensor) > input2 (scalar)
10    int element_num = 1024; // Size of input1 and output
11    int optimize = 1;       // Enable broadcasting
12    int in_elements_num0 = 1024; // Size of input1
13
14    fp_greater_p(element_num, optimize, in_elements_num0, input1, input2, output);
15    return 0;
16}